当前位置:100EC>数字教育>Meta推出全语种语音识别系统 支持1600+语言打破全球沟通壁垒
Meta推出全语种语音识别系统 支持1600+语言打破全球沟通壁垒
网经社发布时间:2025年11月11日 10:28:13

(网经社讯)11月11日信息,Meta公司发布名为Omnilingual ASR的创新语音识别系统,能够处理超过1600种口语语言,其中包括500种此前从未被任何AI系统覆盖的语言。这一突破性技术旨在解决全球语言资源不平等问题,推动人工智能向“通用转录系统”迈进。系统通过先进的机器学习模型,为资源匮乏的语言提供实用支持,标志着在消除语言障碍方面取得重大进展。

网经社教育台(EDU.100EC.CN)了解到,Omnilingual ASR系统的核心优势体现在其高精度与强大扩展性上。测试数据显示,系统在78%的支持语言中实现了字符错误率低于10个的高标准表现。对于拥有至少10小时训练音频的资源丰富语言,这一精度标准覆盖率达到95%;即使是训练资源不足10小时的低资源语言,也有36%达到相同标准,展现出系统对不同资源条件语言的适应能力。系统最具创新性的特点是引入“自带语言”的情境学习功能,借鉴大语言模型技术,用户只需提供少量音频文本配对样本,即可让系统快速学习新语言,无需重新训练或大量计算资源。这一技术理论上可将支持语言扩展至5400种,远超当前行业水平。

为推动技术普及,Meta采取全面开源策略:以Apache2.0许可证发布基于PyTorch的fairseq2框架模型,提供从3亿参数到70亿参数的不同版本;同步发布包含350种代表性不足语言的大型转录语音数据集,采用知识共享署名许可协议。这些举措将助力全球开发者定制本地化语音识别方案,特别为少数民族和濒危语言群体提供技术支撑。该系统的推出不仅填补了语言技术覆盖的空白,更通过开源生态建设促进全球语言平等,为教育、医疗、文化保护等领域的数字化转型提供新可能,标志着人工智能技术在实现真正普惠性方面迈出关键一步。

浙江网经社信息科技公司拥有18年历史,作为中国领先的数字经济新媒体、服务商,提供“媒体+智库”、“会员+孵化”服务;(1)面向电商平台、头部服务商等PR条线提供媒体传播服务;(2)面向各类企事业单位、政府部门、培训机构、电商平台等提供智库服务;(3)面向各类电商渠道方、品牌方、商家、供应链公司等提供“千电万商”生态圈服务;(4)面向各类初创公司提供创业孵化器服务。

网经社“电数宝”电商大数据库(DATA.100EC.CN,免费注册体验全库)基于电商行业18年沉淀,包含100+上市公司、新三板公司数据,150+独角兽、200+千里马公司数据,4000+起投融资数据以及10万+互联网APP数据,全面覆盖“头部+腰部+长尾”电商,旨在通过数据可视化形式帮助了解电商行业,挖掘行业市场潜力,助力企业决策,做电商人研究、决策的“好参谋”。

【投诉曝光】 更多>

【版权声明】秉承互联网开放、包容的精神,网经社欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源网经社;同时,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至NEWS@netsun.com,我们将第一时间核实、处理。

        平台名称
        平台回复率
        回复时效性
        用户满意度
        微信公众号
        微信二维码 打开微信“扫一扫”
        微信小程序
        小程序二维码 打开微信“扫一扫”